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Abstract 

Until now the implementation of education in Indonesia cannot be separated from the complexity of the 
management of educators, one of which is honorary teachers, and bureaucratic reform which has guite 
an impact on the guality of education and the work climate in it. As a way to increase public service 
satisfaction through the state civil apparatus (ASN), the Indonesian Ministry of Education and Culture 
agreed with the Ministry of Administrative Reform and Bureaucratic Reform and the Ministry of Finance 
to change the recruitment system or appointment of government employee teachers from the acceptance 
of prospective Civil Servants. Civil servants (CPNS) become government employees with a work 
agreement (PPPK) which in its implementation there are still obstacles and pros and cons, some agree 
and some disagree. therefore the researcher conducted research on sentiment analysis in data mining in 
the implementation of PPPK teachers on social media Twitter as many as 871 data which were then 
processed into 519 data. the author uses the Naive Bayes and KNN technigues to determine the 
predictive effect of the Naive Bayes and KNN algorithms on public opinion in the implementation of first 
aid instructors and compares the level of accuracy of the 2 methods. Researchers use the RapidMiner 
tool version nine.10.1. The prediction results of Naive Bayes are 328 statistics with positive or agree 
sentiment and 191 information with negative sentiment, and the last is the prediction result from KNN, 
namely 315 information with positive sentiment and 204 facts with negative sentiment. analysis of public 
sentiment on the implementation of teacher first resource on social media Twitter with the Naive Bayes 
algorithm achieves an accuracy of 75.539o. And the KNN achieves an accuracy of 734190. In this study, 
the Naive Bayes method is a technigue with a higher level of accuracy than the KNN with an accuracy 
rate of 75.53 fo. 
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Abstrak 

Hingga saat ini penyelenggaraan pendidikan di Indonesia tidak lepas dari kerumitan tata kelola 
pendidik, salah satunya guru honorer, dan reformasi birokrasi yang cukup berdampak pada kualitas 
pendidikan dan iklim kerja di dalamnya. Sebagai salah satu cara untuk meningkatkan kepuasan 
pelayanan publik melalui aparatur sipil negara (ASN), Kementerian pendidikan dan kebudayaan 
indonesia bersepakat dengan Kementerian Pendayagunaan Aparatur Negara dan Reformasi Birokrasi 
dan Kementerian Keuangan untuk merubah sistem rekrutmen atau pengangkatan guru-guru pegawai 
pemerintah dari penerimaan calon Pegawai Negeri Sipil (CPNS) menjadi pegawai pemerintah dengan 
Perjanjian Kerja (PPPK) yang dalam pelaksanaannya masih terdapat kendala dan pro kontra, ada yang 
setuju dan ada yang tidak setuju. maka dari itu peneliti melakukan penelitian tentang sentiment analisis 
pada data mining pada pelaksanaan PPPK guru di media sosial Twitter sebanyak 871Idata yang 
kemudian diolah menjadi 519 data. penulis menggunakan teknik Naive Bayes, dan KNN untuk 
mengetahui efek prediksi algoritma Naive Bayes dan KNN terhadap opini publik pada implementasi 
instruktur PPPK serta membandingkan tingkat akurasi dari 2 metode tersebut. Peneliti menggunakan 
peralatan RapidMiner versi sembilan.10.1. Hasil prediksi Naive Bayes adalah 328 statistik dengan 
sentimen positif atau setuju dan 191 informasi dengan sentiment negative , dan yang terakhir adalah 
hasil prediksi dari KNN yaitu 315 informasi dengan sentimen postif dan 204 fakta dengan sentimen 
negatif. analisis sentimen masyarakat terhadap implementasi teacher first resource di media sosial 
Twitter dengan algoritma Naive Bayes mencapai akurasi sebesar 75,5390. Dan pada KNN mencapai 
akurasi 73,4190. Pada penelitian ini dapat diketahui bahwa metode Naive Bayes merupakan teknik 
dengan tingkat akurasi yang lebih tinggi dari KNN tersebut dengan tingkat akurasi sebesar 75,53 So. 


Kata Kunci: Analisis Sentimen, PPPK, Twitter, Data Mining 


1. PENDAHULUAN 

Peranan guru saat ini sangat menentukan 
kualitas generasi yang dihasilkan dunia 
pendidikan LI. Sampai saat ini 
penyelenggaraan pendidikan di Indonesia tidak 
terlepas dari masalah manajemen guru yang 
meliputi guru sukarela, dan reformasi birokrasi 
yang mempengaruhi mutu pendidikan dan 
suasana kerjanya (ll. Dalam rangka 
meningkatkan kualitas pelayanan publik atau 
pelayanan publik Aparatur Sipil Negara (ASN), 
Kemendikbud bersepakat dengan Kementerian 
Penguatan dan Birokrasi dan Kementerian 
Keuangan untuk mengubah sistem rekrutmen 
atau penerimaan guru PNS Penerimaan Calon 
Pegawai Negeri Sipil (CPNS) sebagai Pegawai 
Negeri Sipil Kontrakatau pegawai pemerintah 
dengan perjanjian kerja (PPPK) (1). Saat ini, 
pemerintah memiliki rencana besar untuk guru 
sukarelawan di Indonesia, yaitu mengangkat 
satu juta guru sukarelawan untuk Program 
Rekrutmen Pegawai Negeri Sipil dengan 
Kontrak Kerja atau sering disebut pegawai 
pemerintah dengan perjanjian kerja yang 
disingkat PPPK pada tahun 2021. (1). 

PPPK adalah Warga Negara Indonesia 
yang memenuhi persyaratan tertentu dan 
diangkat atas dasar kepegawaian untuk 
menjalankan tugas pemerintahan dalam jangka 
waktu tertentu (2). Berdasarkan Undang- 
Undang Nomor 5 Tahun 2014 tentang Aparatur 
Sipil Negara (ASN) (UU), kontrak PPPK 
minimal satu tahun dan dapat diperpanjang 
maksimal 30 tahun. Itu semua tergantung pada 


situasi dan keadaan tertentu (1). Jika masih ada 
beberapa masalah dan kelebihan dan 
kekurangan dengan pelaksanaannya, ada yang 
setuju dengan PPPK, ada yang tidak. Oleh 
karena itu perlu diketahui pendapat masyarakat 
Indonesia tentang PPPK. Biasanya, orang 
mengungkapkan pendapatnya di jejaring sosial, 
salah satu manfaat dari media sosial adalah 
sebagai media komunikasi massa sehingga 
mampu memberikan popularitas kepada siapa 
saja yang muncul di media massa (3). 

Salah satu aplikasi yang sering 
digunakan masyarakat Indonesia adalah Twitter. 
Menurut data internal Twitter, jumlah pengguna 
Twitter tumbuh 11 persen di Indonesia pada 
kuartal pertama 2018, sedangkan angka global 
hanya 10 persen (4). Pada kuartal kedua, jumlah 
pengguna Twitter di Indonesia tumbuh 31 
persen, sedangkan pertumbuhan global hanya 
11 persen. Pada kuartal ketiga, Twitter 
Indonesia mengalami peningkatan pengguna 
aktif harian sebesar 33 persen, meningkat tajam 
dibandingkan dengan pertumbuhan global yang 
hanya sebesar 9 persen, yang mencapai 
puncaknya pada kuartal akhir 2018. Rata-rata 
pertumbuhan pengguna Twitter di Indonesia 
mencapai 41 persen. sementara di seluruh dunia. 
pertumbuhan konstan sebesar 9 persen (3|. 
Twitter adalah platform untuk berbagi pendapat 
atau pandangan (SJ. Pertumbuhan pengguna 
Twitter di Indonesia sangat pesat dan 
menempati urutan kelima dunia (10J. Orang 
sering menggunakan Twitter untuk 
menyampaikan keluhan, mulai dari keluhan 
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tentang kehidupan sehari-hari hingga keluhan 
tentang kebijakan pemerintah |6|. Oleh karena 
itu, menggunakan Twitter sebagai alat untuk 
mendapatkan informasi tentang PPPK dari opini 
publik Indonesia sangatlah efektif. Perhatikan 
bahwa analisis sentimen adalah bagian dari 
penambangan data. 

Data mining merupakan proses yang 
dapat mengekstraksi informasi, sehingga 
menghasilkan informasi yang sangat berharga 
(7). Dengan kata lain, dapat juga dikatakan 
bahwa data mining adalah proses pencarian 
informasi tentang suatu teknik. Ada banyak 
teknik dan metode dalam data mining (81. Oleh 
karena itu, pemilihan teknik atau algoritma yang 
tepat sangat bergantung pada tujuan yang 
diinginkan (8). Dalam hal ini, peneliti 
menggunakan dua metode dalam analisis 
sentimen — untuk  mengkatagorikan hasil 
komentar netizen dengan melihat prediksi dari 
kedua algoritma yang dipakai terkait 
pelaksanaan  PPPK Guru dan untuk 
memperbandingkan tingkat akurasi dari kedua 
metode tersebut diantaranya adalah metode 
Naive Bayes dan KNN. 

Algoritma KNN adalah salah satu 
algoritma yang sudah popular. KNN ini 
termasuk ke dalam grup instance-based, 
learning. Metode KNN merupakan teknik lazy 
learning (SI. Intinya metode ini digunakan 
untuk  mengklasifikasikan data-data yang 
berdekatan. Beberapa juga berpendapat bahwa 
algoritma KNN adalah algoritma pembelajaran 
yang banyak digunakan dalam cyber-physical- 
social system (CPSS) untuk analisis dan 
penambangan data (data master) (6). Pada studi 
analisis sentimen sebelumnya, algoritma SVM 
memiliki — akurasi yang lebih tinggi 
dibandingkan Naive Bayes dan KNN, dengan 
akurasi rata-rata 90,0196 untuk SVM dengan 
kernel linier dan 79,209o untuk Naive Bayes 
dengan 1 dan 62,104 untuk KNN Angka K 
adalah 20 dan menggunakan kernel yang 
optimal (9). Peneliti lain juga menggunakan 
metode pohon keputusan. Algoritma pohon 
banyak digunakan untuk pengenalan pola 
statistik (6J. Pohon keputusan terdiri dari tiga 
simpu luntuk Menjalankan yaitu daun, dan juga 
terdiri dari simpul akar, yang merupakan titik 
awal dari pohon keputusan, dan yang terakhir 
adalah simpul perantara, terkait dengan 
pengujian. (10). Pada penelitian sebelumnya, 
klasifikasi mencapai akurasi 90,200 untuk 
metode support vector machine dan akurasi 
89,804 untuk metode pohon keputusan. Dari 
sini dapat disimpulkan bahwa metode support 
vector machine memiliki nilai akurasi yang 


lebih tinggi dibandingkan dengan metode pohon 
keputusan (11). 

Selain metode KNN, terdapat metode 
Naive Bayes yaitu metode probabilistik untuk 
pembelajaran mesin. Dengan kata lain, Naive 
Bayes, adalah sebuah metode untuk 
mengklasifikasikan sejumlah besar data dengan 
kecepatan pemrosesan yang tinggi (12). 
Pendapat lain menjelaskan Naive Bayes adalah 
metode yang digunakan untuk peramalan karena 
melibatkan probabilitas sederhana yang 
diterapkan pada teorema Bayes dengan 
ketergantungan yang kuat (13). 

Sebelumnya penulis telah meneliti 
tentang analisis sentiment masyarakat terhadap 
pelaksanaan P3K guru dengan algoritma Naive 
bayes dan Decision Tree (14). Untuk 
membedakan dengan penelitian (14) maka pada 
penelitian ini penulis akan membandingkan 
antara algoritma naive bayes dengan KNN 
dimana keduanya merupakan algoritma 
supervised learning (data sudah di labeli) (151, 
penelitian dilakukan dengan menggunakan dua 
metode yaitu naive bayes dan KNN, peneliti 
mengintegrasikan Twitter sebagai platform bagi 
peneliti untuk mengolah data guna memperoleh 
analisis opini masyarakat terhadap 
penyelenggaraan PPPK guru melalui data 
mining. 

Permasalahan dari penelitian ini adalah 
bagaimana hasil prediksi algoritma Naive 
Bayes dan KNN terkait dengan data opini 
publik tentang pelaksanaan PPPK Guru dan 
berapa tingkat akurasi dari metode KNN, dan 
Naive Bayes. Selain itu, tujuannya adalah untuk 
mengatahui hasil prediksi algoritma naive 
bayes,KNN mengenai data opini masyarakat 
terhadap pelaksanaan PPPK guru dan berapa 
tingkat akurasi dari metode KNN, dan Naive 
Bayes. 


2. METODE PENELITIAN 

Alur dalam penelitian ini terdiri dari beberapa 
langkah, berikut ini Gambar 1 yang menunjukan 
alur penelitian. 


Analisis Sumber: 
data(Pengambila 


'Crawling Data | 
Twett (Twitter 


Search API) n Data yang 


Preprocessing 
Naive Bayes, Data (Cleansing, 
dan KNN Labeling, Case 
Bala Folding, 


Hasil 
Klasifikasi 
Algoritma 


"Evaluasi Data | 
(Cross 
Validation- 


Gambar 1. Alur penelitian 
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Berdasarkan alur penelitian diatas dapat 
dijelaskan dalam penelitian ini Yang pertama 
adalah mengindeks data atau mengumpulkan 
data media sosial di twitter dengan jumlah data 
yang kami dapatkan hingga 871 data kemudian 
dilakukan proses penyaringan data dengan 
operator pemilihan atribut yang digunakan 
untuk memilih teks. dalam data, karena tidak 
ada atribut lain yang diperlukan, proses terakhir 
dalam pengumpulan data adalah data disimpan 
dalam format CSV, yang kemudian diproses 
terlebih dahulu, di mana data yang diperoleh 
dibersihkan dengan operator subproses atau 
replace untuk menghapus RT, URL dan di awal 
dan akhir, menghapus tagar penyebutan yang 
tidak perlu, simbol seperti L.,:"!$9/&"@&)-I 
dan spasi dan lingkaran yang tidak 
perlu pelabelan data positif dan negatif yang 
dikerjakan secara manual dengan bantuan pakar 
bahasa, dilanjutkan dengan klasifikasi data 
dengan algoritma naive bayes dan KNN dan 
tahap selanjutnya yaitu evaluasi data dengan 
cross validation dan akan didapatkan hasil 
klasifikasi dengan kedua algoritma. 


3. HASIL DAN PEMBAHASAN 

3.1 Deskripsi Data 

Crawling data atau pengumpulan data selama 
bualn januari 2022 yaitu dari tanggal 1 sampai 
31 januari 2022 dengan kata kunci PPPK Guru 
dengan menggunakan tools RapidMiner yang 
telah terhubung dengan akun twitter. 
Kumpulkan data dengan jumlah data yang kami 
dapatkan dari media sosial twitter adalah 871 
data, kemudian penyaringan data dilakukan oleh 
operator pemilihan atribut yang digunakan 
untuk memilih teks dari data, karena tidak 
diperlukan atribut lain. .yang dilanjutkan 
dengan preprocessing data hingga 
menghasilkan data yang siap diolah sebanyak 
519 data. 

Pada proses pengklasifikasian text 
mining menggunakan Algoritma Naive Bayes 
ini dibutuhkan langkah-langkah sebagai berikut 
: Persiapan dokumen yang telah berlabel (Positif 
dan Negatif) Pada langkah pertama ini 
disiapkan data dokumen yang telah berlabel 
sentiment yang sudah dilakukan pada proses 
awal penelitian ini sebagaimana yang 
ditunjukkan pada tabel 1. dibawah ini. 


Tabel 1 Contoh dokumen yang sudah dilabeli 

Pernyataan Labeling 
ALHAMDULILLAH 
SELURUH Guru Bisa | Positif 
Tenang 


ALHAMDULILLAH Positif 
Kabar Baik 
Pekerjaan paling | Negatif 


menyebalkan: menunggu 
Kapan ya proses PPPK 
Guru bisa gak molor Dari 
awal pelaksanaan selalu 
molor Padahal — jelas 
dilaksanakan saat pandemi 
jadi alasannya apa sampai 
bisa molor Kalau memang 
butuh waktu lebih kenapa 
ngebuat jadwalnya bisa ga 
sesuai. 


Mentang mentang sekolah | Negatif 
ini pelosok dinas 
pendidikan seakan tutup 
mata akan kualitas sekolah 
Mau melaporkan di 
laporan kampus mengajar 
tp laporannya wajib 
direview dulu sama guru 
dan dinas pendidikan 
setempat jadi percuma 
juga mau pppk cpns kalau 
masih ada yang nakal yang 
sama 


Data yang telah dilabeli dan dilakukan 
preprocessing kemudian hasil preprocessing 
akan dibagi menjadi dua yaitu data latih dan 
data uji. Ada satu hal yang perlu diperhatikan 
tentang klasifikasi ketika kita membagi dataset 
menjadi beberapa k-disk, yaitu kita perlu 
melakukan stratifikasi, artinya kita mempartisi 
atau membagi dataset menjadi k-disk dengan 
kelas yang seimbang. komposisi tiap bagian. 
Validasi silang merupakan teknik validasi yang 
berawal dari pengembangan model validasi 
bersama, dimana validasi silang dapat bekerja 
dengan cepat dengan sampel yang lebih 
terstruktur, sehingga dengan jumlah pengujian, 
beberapa dataset latih dan dataset uji dengan 
data yang berbeda dengan eksperimen 
sebelumnya. Yang nantinya hasil percobaan 
tersebut akan dicatat nilai evaluasi ferporma 
dari sebuah model dengan menggunakan 
confussion matrix. Dalam beberapa penelitian 
yang dilakukan oleh para ahli data mining, 
dalam pengujian model atau validasi model 
algoritma klasifikasi, validasi silang lebih sering 
digunakan daripada validasi terpisah atau split 
validation karena model validasi yang 
menerapkan 10 validasi silang sudah standar 
dan validasi yang matang. Sebuah metode yang 
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lebih praktis dan efektif, serta mampu sedikit 
meningkatkan nilai akurasi. Berikut ini adalah 
Gambar 2 yaitu crosscheck image atau gambar 
cross validation menggunakan rapidminer. 


Process Parameters 
0 protes» Pj Pudar oven 
iton daa ammou 


Besa CSV Monnal to Ter Process Documerts 


“39 “ad 5 is pg 2 du 


ber otas 


Li & ten asance4 parameter: 


“4 Crane cempahaiite 410.001 


Gambar 2. cross validation menggunakan 
rapidminer 


3.2 Pembahasan 

Dalam tahap pembahasan akan terdapat 
gambar dan grafik dari hasil analisis dan 
prediksi dari masing-masing algoritma. 
Berikut ini merupakan Gambar 3 yang 
merupakan gambar cross  validation 
menggunakan naive bayes. 


Process 


(@ Erasess » Cross Validation » 22 


Gambar 3. cross validation naive bayes 
rapidminer 


Berikut hasil akurasi dan prediksi naive bayes. 
Accuracy adalah rasio prediksi benar (positif & 
negatif) menggunakan holistik data. Akurasi 
menjawab pertanyaan berapa persen sentimen 
yang benar diprediksi positif dan negatif dari 
keseluruhan data tes berikut ini persamaan 1 
dan hasil prediski dari naive bayes. 


Akurasi-(TP - TN)/ (TP 4 FP 4 FN 4 TN) 4) 


Akurasi — (240 4 152) / (240 4 88 4 39 4 152) 
- 392/519 
- 0.75 


Di bawah ini merupakan Gambar 4 yang 
menunjukan hasil akurasi dari naive bayes. 


@ Table view O) Plot View 


accuracy: 75.534 “1-5.388 (micro average: 75.538) 

true Negatif true Positif class precision 
pred. Negatit 152 39 79.589 
pred. Positif 88 240 734796 


class recall 63.396 86.0206 


Gambar 4. akurasi naive bayes 


Dari data Gambar 4 diatas analisis 
menggunakan aplikasi repidminer dengan 
algoritma naive bayes didapatkan hasil dengan 
tingkat akurasi 75,5396. Dari 519 data yang ada, 
hasil prediksi naive bayes yaitu 328 
diantaranya merupakan tanggapan masarakat 
yang memiliki sentimen positif terhadap 
pelaksaan PPPK Guru, sedangkan sisanya 191 
merupakan tanggapan masarakat yang memiliki 
sentimen negatif terhadap pelaksaan PPPK 
Guru. Berikut ini gambar 5 yang merupakan 
grafik hasil prediksi naive bayes. 


Hasil Prediksi 
Naive Bayes 


m Positif WM Negatif 


Gambar 5. Hasil prediksi naive bayes 


Selanjutnya kita akan lihat Gambar 6 cross 
validation dengan algoritma KNN dengan 
jumlah K yang akan penulis gunakan adalah 2. 


Gambar 6. KNN cross validation 


Berikut hasil akurasi dan prediksi dari KNN 
dengan jumlah K-2. Accuracy adalah rasio 
prediksi benar (positif & negatif) menggunakan 
holistik data. Dalam menghitung akurasi pada 
algoritma KNN di gunakan persamaan 1. 
Berikut hasil akurasi dari KNN.S 


Akurasi — (228 4 153) / (228 4 87 4 51 4 153) 
- 381/519 
- 0.73 


Berikut ini gambar 7 yaitu hasil akurasi dari 
algoritma KNN. 


Gambar 7. Hasil Akurasi KNN 
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Data yang diproleh dari twitter dilakukan 
preprocessing dan juga dilabeli secara manual 
dengan dua kategori yaitu positif dan negatif, 
yang kemudian dilakukan perbandingan hasil 
klasifikasi dengan hasil prediksi dari tiga 
algoritma yaitu naive bayes, decision tree dan 
KNN. Hasil prediksi dari metode KNN dapat 
dilihat pada grafik dibawah ini. Berikut ini 
Gambar 8 yaitu grafik hasil prediksi KNN. 


Grafik Hasil KNN 


m Positif 


M Negatif 


Gambar 8. Grafik hasil prediksi KNN 


Berdasarkan dari gambar diatas dari 519 data 
yang digunakan 315 diantaranya merupakan 
tanggapan masarakat yang memiliki sentimen 
positif terhadap pelaksaan PPPK Guru, 
sedangkan sisanya 204 merupakan tanggapan 
masarakat yang memiliki sentimen negatif 
terhadap pelaksaan PPPK Guru. 


4. KESIMPULAN 

Berdasarkan hasil dan pembahasan diatas 
dapat disimpulkan bahwa dari 519 data yang 
telah dilabeli secara manual dan dilakukan 
preprocessing yang selanjutnya diklasifikasikan 
dan dilakukan validasi data dengan k-fold cross 
validation dan confusion matrik dengan jumlah 
k510. Hasil prediksi naive bayes yaitu 328 data 
bersentimen positif dan 191 data bersentimen 
negatif, dan yang terakhir yaitu hasil prediksi 
dari KNN yaitu 315 data bersentimen positif 
dan 204 data bersentimen negatif. Analisis 
sentimen masyarakat terhadap pelaksanaan 
PPPK guru pada media sosial Twitter dengan 
algoritma naive bayes mencapai tingkat akurasi 
15,539. Dan yang terakhir adalah algoritma 
KNN mencapai akurasi 73,414. Dalam 
penelitian ini, dapat diketahui bahwa metode 
Naive Bayes adalah metode yang tingkat 
akurasinya lebih tinggi dibandingkan KNN 
dengan tingkat akurasi sebesar 75,534. 
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